智能论文笔记

Self-Score: Self-Supervised Learning on Score-Based Models for MRI Reconstruction

Zhuo-Xu Cui , Chentao Cao , Shaonan Liu , Qingyong Zhu , Jing Cheng , Haifeng Wang , Yanjie Zhu , Dong Liang

分类：计算机视觉

2022-09-02

最近，基于得分的扩散模型在MRI重建中表现出令人满意的性能。这些方法中的大多数都需要大量完全采样的MRI数据作为培训集，有时在实践中很难获得。本文提出了用于MRI重建的完全采样的基于无DATA的分数扩散模型，该模型以不足的采样数据以自我监督的方式学习了完全采样的MR图像。具体而言，我们首先通过贝叶斯深度学习从未采样的数据中推断出完全采样的MR图像分布，然后通过训练分数函数来扰动数据分布并近似其概率密度梯度。利用学到的分数函数为先验，我们可以通过执行条件的Langevin Markov链蒙特卡洛（MCMC）采样来重建MR图像。公共数据集的实验表明，所提出的方法优于现有的自我监督的MRI重建方法，并与常规（完全采样的数据训练）基于得分的扩散方法实现可比性的性能。

translated by 谷歌翻译

HTML版本

Grounded Affordance from Exocentric View

Hongchen Luo , Wei Zhai , Jing Zhang , Yang Cao , Dacheng Tao

分类：计算机视觉

2022-08-28

负担基础旨在找到物体的“行动可能性”区域，这是迈向体现智能的重要一步。由于交互负担的多样性，不同个体的独特性会导致各种互动，这使得很难在对象零件和负担能力标签之间建立明确的联系。人的能力将各种自以为是的相互作用转变为不变的以自负的负担来应对互动多样性的影响。为了使代理具有这种能力，本文提出了一项负担得起的任务，即从外向观点（即给定的中心人类对象的互动和以自我为中心的对象图像），学习对象的负担得起的知识并将其传输到中心图像中负担标签作为监督。但是，角色之间存在一些“互动偏见”，主要是关于不同的区域和不同观点。为此，我们设计了一个跨视图的负担得起的知识转移框架，该框架从Exentric互动中提取特定于负担的特定功能，并将其转移到以自我为中心的视图中。具体而言，通过保留负担共同关系来增强对负担区域的看法。此外，一个名为AGD20K的负担得起的基础数据集是通过收集和标记20k $ 36 $负担能力类别的20k图像来构建的。实验结果表明，我们的方法优于有关客观指标和视觉质量的代表性模型。代码在https://github.com/lhc1224/cross-view-affordance-grounding上发布。

translated by 谷歌翻译

ReAct: Temporal Action Detection with Relational Queries

Dingfeng Shi , Yujie Zhong , Qiong Cao , Jing Zhang , Lin Ma , Jia Li , Dacheng Tao

分类：计算机视觉 | 人工智能

2022-07-14

这项工作旨在使用带有动作查询的编码器框架（类似于DETR）来推进时间动作检测（TAD），该框架在对象检测中表现出了巨大的成功。但是，如果直接应用于TAD，该框架遇到了几个问题：解码器中争论之间关系的探索不足，由于培训样本数量有限，分类培训不足以及推断时不可靠的分类得分。为此，我们首先提出了解码器中的关系注意机制，该机制根据其关系来指导查询之间的注意力。此外，我们提出了两项损失，以促进和稳定行动分类的培训。最后，我们建议在推理时预测每个动作查询的本地化质量，以区分高质量的查询。所提出的命名React的方法在Thumos14上实现了最新性能，其计算成本比以前的方法低得多。此外，还进行了广泛的消融研究，以验证每个提出的组件的有效性。该代码可在https://github.com/sssste/reaeact上获得。

translated by 谷歌翻译

Towards Data-Efficient Detection Transformers

Wen Wang , Jing Zhang , Yang Cao , Yongliang Shen , Dacheng Tao

分类：计算机视觉 | 人工智能

2022-03-17

检测变压器已在富含样品的可可数据集上实现了竞争性能。但是，我们显示他们中的大多数人在小型数据集（例如CityScapes）上遭受了大量的性能下降。换句话说，检测变压器通常是渴望数据的。为了解决这个问题，我们通过逐步过渡从数据效率的RCNN变体到代表性的DETR，从经验中分析影响数据效率的因素。经验结果表明，来自本地图像区域的稀疏特征采样可容纳关键。基于此观察结果，我们通过简单地简单地交替如何在跨意义层构建键和价值序列，从而减少现有检测变压器的数据问题，并对原始模型进行最小的修改。此外，我们引入了一种简单而有效的标签增强方法，以提供更丰富的监督并提高数据效率。实验表明，我们的方法可以很容易地应用于不同的检测变压器，并在富含样品和样品的数据集上提高其性能。代码将在\ url {https://github.com/encounter1997/de-detrs}上公开提供。

translated by 谷歌翻译

Conversion Rate Prediction via Meta Learning in Small-Scale Recommendation Scenarios

Xiaofeng Pan , Ming Li , Jing Zhang , Keren Yu , Luping Wang , Hong Wen , Chengjun Mao , Bo Cao

分类：机器学习

2021-12-27

与淘宝和亚马逊等大型平台不同，由于严重的数据分配波动（DDF）问题，在小规模推荐方案中开发CVR模型是更具挑战性的。 DDF防止现有的CVR模型自生效以来，因为1）需要几个月的数据需要足够小的场景训练CVR模型，导致培训和在线服务之间的相当大的分布差异; 2）电子商务促销对小型情景产生了更大的影响，导致即将到期的时间段的不确定性。在这项工作中，我们提出了一种名为MetacVR的新型CVR方法，从Meta学习的角度解决了DDF问题。首先，由特征表示网络（FRN）和输出层组成的基础CVR模型是精心设计和培训的，在几个月内与样品充分设计和培训。然后，我们将不同数据分布的时间段视为不同的场合，并使用相应的样本和预先训练的FRN获得每个场合的正面和负原型。随后，设计了距离度量网络（DMN）以计算每个样本和所有原型之间的距离度量，以便于减轻分布不确定性。最后，我们开发了一个集合预测网络（EPN），该网络（EPN）包含FRN和DMN的输出以进行最终的CVR预测。在这个阶段，我们冻结了FRN并用最近一段时间的样品训练DMN和EPN，因此有效地缓解了分布差异。据我们所知，这是在小规模推荐方案中针对DDF问题的CVR预测第一次研究。实验结果对现实世界数据集验证了我们的MetacVR和Online A / B测试的优越性也表明我们的模型在PCVR上实现了11.92％的令人印象深刻的收益和GMV的8.64％。

translated by 谷歌翻译

SAME: Scenario Adaptive Mixture-of-Experts for Promotion-Aware Click-Through Rate Prediction

Xiaofeng Pan , Yibin Shen , Jing Zhang , Keren Yu , Hong Wen , Shui Liu , Chengjun Mao , Bo Cao

分类：机器学习

2021-12-27

促销活动在电子商务平台上变得更加重要和普遍，以吸引客户和提升销售。但是，推荐系统中的点击率（CTR）预测方法无法处理此类情况，因为：1）他们无法概括为服务，因为在线数据分布是不确定的，因为可能正在推出的促销潜在的促销; 2）在不够重视方案信号的情况下，它们无法学习在每个场景中共存的不同特征表示模式。在这项工作中，我们提出了方案自适应混合的专家（相同），这是一个简单而有效的模型，用于促销和正常情况。从技术上讲，它通过采用多个专家来学习专家来遵循专家混合的想法，这些特征表示通过注意机制通过特征门控网络（FGN）进行调制。为了获得高质量的表示，我们设计了一个堆叠的并行关注单元（SPAU），以帮助每个专家更好地处理用户行为序列。为了解决分布不确定性，从时间序列预测的角度精确地设计了一组场景信号，并馈入FGN，其输出与来自每个专家的特征表示连接，以学会注意。因此，特征表示的混合是自适应的场景和用于最终的CTR预测。通过这种方式，每个专家都可以学习鉴别的表示模式。据我们所知，这是第一次推广感知CTR预测的研究。实验结果对现实世界数据集验证了同一的优势。在线A / B测试也表现出同样的促销期间在CTR上的显着增益和5.94％的IPV，分别在正常日内为3.93％和6.57％。

translated by 谷歌翻译

EGFN: Efficient Geometry Feature Network for Fast Stereo 3D Object Detection

Aqi Gao , Yanwei Pang , Jing Nie , Jiale Cao , Yishun Guo

分类：计算机视觉

2021-11-28

快速的基于立体声的3D对象探测器最近在推理时间感到很大进展。然而，它们的精确度远远落后于高精度的方法。我们认为主要原因是快速立体声方法中缺失或差的3D几何特征表示。为了解决这个问题，我们提出了一个有效的几何特征生成网络（EGFN）。我们的EGFN的关键是一种有效且有效的3D几何特征表示（EGFR）模块。在EGFR模块中，首先生成轻量级成本体积特征，然后将其有效地转换为3D空间，并且最后进行图像和3D空间中的多尺度特征，以获得3D几何特征：增强的轻量级voxel特色。此外，我们介绍了一种新的多尺度知识蒸馏策略，以指导多尺度3D几何特征学习。公共基准测试集的实验结果表明，建议的EGFN优于Yolostsereo3D，先进的快速方法，在Map $ 5.16 \％上的$ _ {3d} $以仅需12毫秒的成本，因此实现了更好的权衡立体声3D对象检测的准确性和效率。我们的代码将公开提供。

translated by 谷歌翻译

Towards Inter-class and Intra-class Imbalance in Class-imbalanced Learning

Zhining Liu , Pengfei Wei , Zhepei Wei , Boyang Yu , Jing Jiang , Wei Cao , Jiang Bian , Yi Chang

分类：机器学习 | 人工智能

2021-11-24

学习（IL）是数据挖掘应用中广泛存在的重要问题。典型的IL方法利用直观的类努力重新采样或重新重量直接平衡训练集。然而，特定领域的一些最近的研究努力表明，在没有课堂上操纵的情况下可以实现类别不平衡的学习。这提示我们思考两种不同的IL战略之间的关系和班级不平衡的性质。从根本上说，它们对应于IL中存在的两个必要的不平衡：来自不同类别的示例之间的数量差异以及单个类中的易于和硬示例之间，即阶级和级别的帧内不平衡。现有工程未能明确地考虑不平衡，因此遭受次优绩效。鉴于此，我们呈现了双重平衡的集合，即杜博士，一个多功能的集合学习框架。与普遍方法不同，Dube直接执行级别的级别和级别的平衡，而无需依赖基于距离的距离的计算，这允许它在计算效率时实现竞争性能。我们还提出了关于基于杜博伊的不同间/内部平衡策略的优缺点的详细讨论和分析。广泛的实验验证了所提出的方法的有效性。代码和示例可在https://github.com/iCde20222sub/duplebalance获得。

translated by 谷歌翻译

IMBENS: Ensemble Class-imbalanced Learning in Python

Zhining Liu , Zhepei Wei , Erxin Yu , Qiang Huang , Kai Guo , Boyang Yu , Zhaonian Cai , Hangting Ye , Wei Cao , Jiang Bian

分类：机器学习 | 人工智能

2021-11-24

Imbalanced-leasemble，缩写为IMBens，是一个开源Python工具箱，用于快速实现和部署类别 - 不平衡数据的集合学习算法。它提供对多个最先进的集合不平衡学习（EIL）方法，可视化器和公用事业功能的访问，以处理类别不平衡问题。这些集合方法包括基于重采样的，例如/过度采样，以及重量基于/过度采样，例如，敏感的学习。除了实现之外，我们还扩展了传统的二进制EIL算法，与多级支持和重采样调度程序等新功能，从而使它们能够处理更复杂的任务。该软件包是在简单的，良好的API设计中开发的，遵循Scikit-Gearn的易于使用。 IMBens在MIT开源许可证下发布，可以从Python包索引（PYPI）安装。 https://github.com/zhiningliu1998/imbalanced-ensemble可以使用源代码，二进制文件，详细文档和使用示例。

translated by 谷歌翻译

HADFL: Heterogeneity-aware Decentralized Federated Learning Framework

Jing Cao , Zirui Lian , Weihong Liu , Zongwei Zhu , Cheng Ji

分类：机器学习 | 人工智能

2021-11-16

联合学习（FL）支持地理分布式设备的培训模型。然而，传统的FL系统采用集中式同步策略，提高了高通信压力和模型泛化挑战。 FL的现有优化未能加速异构设备的培训或遭受差的通信效率。在本文中，我们提出了一个支持在异构设备上分散的异步训练的框架的Hadfl。使用本地数据的异质性感知本地步骤本地培训设备。在每个聚合循环中，基于执行模型同步和聚合的概率来选择它们。与传统的FL系统相比，HADFL可以减轻中心服务器的通信压力，有效地利用异构计算能力，并且可以分别实现比Pytorch分布式训练方案分别的最大加速度为3.15倍，而不是Pytorch分布式训练方案，几乎没有损失收敛准确性。

translated by 谷歌翻译